Champs de Markov conditionnels pour le traitement de séquences
نویسندگان
چکیده
Résumé. Les modèles conditionnels du type modèles de Markov d’entropie maximale et champs de Markov conditionnels apportent des réponses aux lacunes des modèles de Markov cachés traditionnellement employés pour la classification et la segmentation de séquences. Ces modèles conditionnels ont été essentiellement utilisés jusqu’à présent dans des tâches d’extraction d’information ou d’étiquetage morphosyntaxique. Cette contribution explore l’emploi de ces modèles pour des données de nature différente, de type « signal », telles que la parole ou l’écriture en ligne. Nous proposons des architectures de modèles adaptées à ces tâches pour lesquelles nous avons dérivé les algorithmes d’inférence et d’apprentissage correspondant. Nous fournissons des résultats expérimentaux pour deux tâches de classification et d’étiquetage de séquences.
منابع مشابه
Interpolation par assimilation variationnelle de séquences multimodales d'images satellitaires de l'océan
RÉSUMÉ. Cet article étudie l’estimation conjointe de données manquantes et de champs de déplacements dans des séquences multimodales d’observations satellitaires géophysiques. La complexité de la tâche est liée au taux élevé de données manquantes (entre 20 % et 90 %) pour des observations journalières de haute résolution et la reconstruction de structures fines en accord avec la dynamique sous-...
متن کاملGénération des prononciations de noms propres à l'aide des Champs Aléatoires Conditionnels (Pronunciation generation for proper names using Conditional Random Fields) [in French]
Dans cet article, nous proposons une approche de conversion graphème-phonème pour les noms propres. L'approche repose sur une méthode probabiliste : les Champs Aléatoires Conditionnels (Conditional Random Fields, CRF). Les CRFs donnent une prévision à long terme, n'exigent pas l'indépendance des observations et permettent l'intégration de tags. Dans nos travaux antérieurs, l'approche de convers...
متن کاملReprésentation et reconnaissance de caractères manuscrits par Réseaux Bayésiens Dynamiques
Les approches stochastiques, tels que les modèles de Markov cachés (HMM), sont largement utilisées pour la reconnaissance de la parole et de l’écrit (Elms et al. 1998 ; Hallouli et al. 2002) pour leur capacité à s’adapter aux distorsions élastiques temporelles et spatiales. Cependant ces modèles sont mono-dimensionnels. Une adaptation doit donc être réalisée pour les images, par nature bi-dimen...
متن کاملMéthodes à noyaux appliquées aux textes structurés
Résumé. Cet article ébauche un état de l’art sur l’utilisation des noyaux pour le traitement des données structurées. Les applications modernes de la fouille de données sont de plus en plus confrontés à des données structurées, notamment textuelles. Les algorithmes d’apprentissage doivent donc être capables de tirer parti des informations apportées par la structure, ce qui pose d’intéressants p...
متن کاملExtraction de propriétés de produits
RÉSUMÉ. Le travail présenté dans cet article vise à extraire automatiquement certaines caractéristiques de produits à partir de descriptions textuelles fournies par un site marchand. La constitution d’un corpus de référence annoté révèle certains problèmes, provenant à la fois des textes et des particularités de la tâche. Pour l’aborder, nous avons testé deux approches : une méthode d’extractio...
متن کامل